Проанализируйте и сравните варианты рассуждений (CoT): Различайте архитектуры само-согласованности, программа мышления (PoT), дерево мышления (ToT) и граф мышления (GoT).
Оцените методы редактирования знаний: Понимайте метрики надежности, локальности и переносимости, а также различайте внутренние (ROME) и внешние (SERAC) решения для редактирования.
Оцените математические логические пайплайны: Определите используемые обучающие данные (GSM8K, MATH, AIME) и процессы дистилляции, применяемые для усиления длительных математических рассуждений в моделях, таких как DeepSeek-Math и o1.